Un primo corso di probabilità: L'universalità della linearità

La universalità della linearità è forse il metodo più potente nella teoria della probabilità. Permette di calcolare il valore atteso della somma di variabili casuali semplicemente sommando i loro valori attesi individuali, indipendentemente dal fatto che tali variabili siano indipendenti, correlate o mutuamente esclusive.

1. Fondamenti e Proposizione 2.1

Per capire perché il valore atteso si comporta così linearmente, consideriamo Legge dello statistico inconsapevole (LOTUS) per i sistemi multivariati. Proposizione 2.1 afferma che se $X$ e $Y$ hanno una funzione di massa congiunta $p(x, y)$, allora il valore atteso di qualsiasi funzione $g(X, Y)$ è:

$$E[g(X, Y)] = \sum_{y} \sum_{x} g(x, y) p(x, y)$$

Per variabili continue con funzione densità congiunta $f(x, y)$, la forma equivalente integrale è:

$$E[g(X, Y)] = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} g(x, y) f(x, y) dx dy$$

2. Il principio di linearità

Applicando LOTUS alla funzione $g(X, Y) = X + Y$, deriviamo il teorema centrale di questo capitolo: $E[X + Y] = E[X] + E[Y]$. Questo si estende naturalmente a qualsiasi insieme finito:

$E\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n E[X_i]$

Questo è "universale" perché non richiede alcuna ipotesi sulla distribuzione congiunta. Che le variabili siano indipendenti o fortemente dipendenti, la media della somma è la somma delle medie.

Esempio 2a: Il problema dell'ambulanza

Consideriamo un incidente nel punto $X$ su una strada di lunghezza $L$ e un'ambulanza nel punto $Y$, dove $X, Y \sim U(0, L)$ e sono indipendenti. Usiamo LOTUS multivariato per trovare $E[|X-Y|]$:

La funzione densità congiunta è $f(x, y) = 1/L^2$ per $0 \le x, y \le L$.

$$E[|X-Y|] = \int_0^L \int_0^L |x-y| \frac{1}{L^2} dx dy = \frac{L}{3}$$

3. Monotonia e limiti

Il valore atteso preserva l'ordine delle variabili casuali. Se $X \ge Y$ per tutti gli esiti, allora $E[X] \ge E[Y]$. Ciò segue da Esempio 2b: se $X - Y \ge 0$, allora $E[X - Y] \ge 0$. Inoltre, se una variabile è limitata in modo tale che $P\{a \le X \le b\} = 1$, allora segue che $a \le E[X] \le b$.

4. La media campionaria (Esempio 2c)

Siano $X_1, \dots, X_n$ un campione da una distribuzione con media $\mu$. La media campionaria è definita come:

$$\bar{X} = \sum_{i=1}^{n} \frac{X_i}{n}$$

Grazie alla linearità, $E[\bar{X}] = \frac{1}{n} \sum E[X_i] = \frac{n\mu}{n} = \mu$. Il valore atteso della media campionaria è $\mu$, dimostrando che è uno stimatore non distorto.

⚠️ L'avvertimento infinito

Quando si ha a che fare con un'infinita collezione di variabili casuali $X_i, i \ge 1$, non è necessariamente vero che $E[\sum_{i=1}^\infty X_i] = \sum_{i=1}^\infty E[X_i]$. Lo scambio è valido solo se:

Le $X_i$ sono tutte variabili casuali non negative.
La serie è assolutamente convergente: $\sum_{i=1}^\infty E[|X_i|] < \infty$.

DOMANDA 1

Un giocatore lancia un dado equilibrato e contemporaneamente fa cadere una moneta equilibrata. Se esce testa, vince il doppio del valore del dado; se esce croce, vince metà del valore del dado. Quali sono le sue vincite attese?

3,500

4,375

5,250

3,125

DOMANDA 2

Considera 3 prove con la stessa probabilità di successo. Sia $X$ il numero totale di successi. Se $E[X] = 1,8$, qual è il valore massimo possibile di $P\{X = 3\}$?

0,6

1,0

0,18

0,8

DOMANDA 3

Qual è il valore atteso della somma ottenuta quando si lanciano $n$ dadi equilibrati?

$n$

$3n$

$3,5n$

$6n$

DOMANDA 4

In $n$ prove dove la prova $i$ ha successo con probabilità $p_i$, qual è il numero totale atteso di successi?

$n \cdot \max(p_i)$

$\prod p_i$

$\sum p_i$

DOMANDA 5

In quale condizione $E[\sum_{i=1}^\infty X_i] = \sum_{i=1}^\infty E[X_i]$ è garantito valido?

Le $X_i$ sono tutte indipendenti.

Le $X_i$ sono tutte non negative.

Le variabili hanno la stessa media.

Il numero di variabili è primo.